Python3 编程中如何用 PyPDF2 快速拆分 PDF 文档？

2023-04-14 02:50| 来源: 网络整理| 查看: 265

PyPDF2是Python中一个非常常用的PDF处理库，它可以用于创建、合并、分割、加密和解密PDF文件等操作。以下是如何用PyPDF2快速拆分PDF文档的步骤：

1. 安装PyPDF2库

pip install PyPDF2

2. 导入PyPDF2库

import PyPDF2

3. 打开PDF文档

pdf_file = open('your_pdf_file.pdf', 'rb')

这里需要注意，要以二进制方式读取PDF文件，即要指定文件模式为“rb”。

4. 创建PDF文档读取器

pdf_reader = PyPDF2.PdfFileReader(pdf_file)

5. 循环遍历每一页，逐页拆分并保存为单独的文件

for page_num in range(pdf_reader.numPages): # 创建一个新的PDF写入器 pdf_writer = PyPDF2.PdfFileWriter() # 获取当前页面 page = pdf_reader.getPage(page_num) # 将当前页面添加到写入器中 pdf_writer.addPage(page) # 生成新的PDF文件名 new_file_name = f"output_page_{page_num + 1}.pdf" # 创建新的PDF文件并保存写入器中的页面 with open(new_file_name, 'wb') as new_pdf_file: pdf_writer.write(new_pdf_file)

这里我们使用了numPages方法获取PDF文件总页数，然后遍历每一页，逐页拆分并保存为单独的文件。在拆分每一页时，我们需要创建一个新的PDF写入器，将当前页添加到写入器中，然后生成新的PDF文件名，并将写入器中的页面保存到新文件中。

6. 关闭文件

pdf_file.close()

完整的代码如下：

import PyPDF2 pdf_file = open('your_pdf_file.pdf', 'rb') pdf_reader = PyPDF2.PdfFileReader(pdf_file) for page_num in range(pdf_reader.numPages): pdf_writer = PyPDF2.PdfFileWriter() page = pdf_reader.getPage(page_num) pdf_writer.addPage(page) new_file_name = f"output_page_{page_num + 1}.pdf" with open(new_file_name, 'wb') as new_pdf_file: pdf_writer.write(new_pdf_file) pdf_file.close()

以上是使用PyPDF2库进行PDF文档拆分的方法。

【本文地址】

公司简介

联系我们